Group $K$-Means
نویسندگان
چکیده
We study how to learn multiple dictionaries from a dataset, and approximate any data point by the sum of the codewords each chosen from the corresponding dictionary. Although theoretically low approximation errors can be achieved by the global solution, an effective solution has not been well studied in practice. To solve the problem, we propose a simple yet effective algorithm Group K-Means. Specifically, we take each dictionary, or any two selected dictionaries, as a group of K-means cluster centers, and then deal with the approximation issue by minimizing the approximation errors. Besides, we propose a hierarchical initialization for such a non-convex problem. Experimental results well validate the effectiveness of the approach.
منابع مشابه
Persistent K-Means: Stable Data Clustering Algorithm Based on K-Means Algorithm
Identifying clusters or clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a common technique for statistical data analysis This paper proposed an improved version of K-Means algorithm, namely Persistent K...
متن کاملA Hybrid Data Clustering Algorithm Using Modified Krill Herd Algorithm and K-MEANS
Data clustering is the process of partitioning a set of data objects into meaning clusters or groups. Due to the vast usage of clustering algorithms in many fields, a lot of research is still going on to find the best and efficient clustering algorithm. K-means is simple and easy to implement, but it suffers from initialization of cluster center and hence trapped in local optimum. In this paper...
متن کاملComparing k-means clusters on parallel Persian-English corpus
This paper compares clusters of aligned Persian and English texts obtained from k-means method. Text clustering has many applications in various fields of natural language processing. So far, much English documents clustering research has been accomplished. Now this question arises, are the results of them extendable to other languages? Since the goal of document clustering is grouping of docum...
متن کاملتصحیح سیستم طبقهبندی امتیاز تودهسنگ با استفاده از الگوریتمهای خوشهبندی k-means و fuzzy c-means
با توجه به اهمیت و کاربرد سیستم طبقهبندی امتیاز تودهسنگ در مهندسی سنگ، هدف از این مقاله تصحیح کلاسهای نهایی این سیستم طبقهبندی با استفاده از الگوریتمهای خوشهبندی k-means و fuzzy c-means (FCM) است. در سیستم طبقهبندی امتیاز تودهسنگ دادهها توسط یک سری از اطلاعات اولیه بر مبنای نظریات و قضاوتهای تجربی طبقهبندی میشوند ولی با کاربرد الگوریتمهای خوشهبندی در این سیستم طبقهبندی، کلاس...
متن کاملModification of the Fast Global K-means Using a Fuzzy Relation with Application in Microarray Data Analysis
Recognizing genes with distinctive expression levels can help in prevention, diagnosis and treatment of the diseases at the genomic level. In this paper, fast Global k-means (fast GKM) is developed for clustering the gene expression datasets. Fast GKM is a significant improvement of the k-means clustering method. It is an incremental clustering method which starts with one cluster. Iteratively ...
متن کاملاستخراج و طبقهبندی تصاویر طرح سنگ شور پوشاک جین با استفاده از الگوریتم خوشهبندی K-means
با توجه به استقبال گسترده نسل جوان از پوشاک جین و به طور ویژه شلوارهای جین، طراحی و کنترل کیفیت این لباسها از اهمیت بسزایی برخوردار است. با توجه به اهمیت این موضوع در صنعت پوشاک، هنوز طبقهبندی خاصی برای طرحهای سنگ شور مورد استفاده در شلوار جین ارائه نشده است. در این مقاله، از 306 طرح سنگ شور جلو و پشت شلوار جین در شرایط یکسان نورپردازی، تصویربرداری شد. پس از پیش پردازش تصاویر، با استفاده...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- CoRR
دوره abs/1501.00825 شماره
صفحات -
تاریخ انتشار 2015